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摘要 : 中 国明 安 图 超 宽 频谱 射电 日 像 仪 (Mingantu Ultrawide Spectral Radioheliograph , 
MUSER) 进 入 实际 观测 后 ,每 3 ms 产生 一 帧 100 kB 左右 的 数据 ， 每 天 的 原始 观测 数据 约 
3.5 TB。 由 于 射电 日 像 仪 的 原始 数据 采用 自 定 义 格 式 ， 为 了 后 续 数 据 分 析 和 共享 的 需要 ， 有 
必要 根据 数据 存储 需求 把 这 些 原 始 数据 转换 成 天 文 常用 的 文件 格式 。 在 前 期 工作 中 已 经 实现 
了 原始 数据 格式 到 UVFITS 文件 的 转换 ， 在 此 基础 上 研究 了 基于 MPI 的 集群 并 行 环境 下 
UVFITS 合成 系统 的 性 能 优化 。 通 过 实验 验证 ， 在 改进 后 的 并 行 环境 下 ，UVFITS 合成 系统 的 
性 能 达到 了 需求 的 2.5 倍 ， 可 以 有 效 处 理 当前 及 未 来 一 定时 间 内 射电 日 像 仪 的 海量 观测 数 
据 。 同 时 ， 改 进 后 的 系统 具有 良好 的 横向 扩展 能 力 ， 能 够 为 相关 项 目的 数据 处 理 提 供 借鉴 和 
参考 。 
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中 国明 安 图 超 宽 频谱 射电 日 像 仪 (Mingantu Ultrawide Spectral Radioheliograph, MUSER ) 是 同时 以 高 
时 间 、 空 间 和 频率 分 辩 率 对 太阳 进行 射电 频谱 成 像 的 设备 '"| 。 随 着 进入 系统 联 调和 试 观测 阶段 ， 当 前 
迫切 需要 实现 试 观测 结果 的 存储 、 处 理 ， 以 推进 设备 误差 修正 、 设 备 定 标 等 一 系列 工作 。 这 其 中 ， 需 要 
应 用 当前 射电 天 文 领域 的 相关 软件 ， 如 天 文 应 用 软件 公共 包 ( Common. Astronomy Software Applications, 
CASA) 等 对 试 观测 数据 进行 处 理 与 分 析 ， 从 而 获得 同行 公认 的 结果 。 如 何 将 观测 得 到 的 结果 快速 
保存 为 天 文 应 用 软件 公共 包 可 以 接受 的 数据 格式 成 为 当前 一 个 急需 解决 的 问题 。 

在 射电 天 文 领域 ， 数 据 存储 广泛 采用 随机 组 (Random groups) 结构 的 FITS 文件 9 ， 因 此 主要 保存 
UV 复 可 见 条 纹 数据 也 经 常 被 称 为 UVFITS 文件 。 

目前 ，MUSER-I 以 3 帧 / 秒 的 速率 产生 数据 ， 每 产生 S 帧 数据 后 利用 1 ms 的 时 间 用 于 数据 传送 。 
故 每 25 ms 产生 8 帧 的 数据 ， 如 此 循环 ， 直 到 I min 生成 一 个 大 的 数据 文件 。 该 文件 包含 观测 的 详细 
数据 信息 ， 大 小 将 近 2 GB， 其 中 包含 19 200(8 x 40x 60) 帧 。 由 于 其 中 间隔 8 帧 产生 的 数据 出 自 同一 
天 线 ， 故 可 根据 需求 ， 对 8 帧 的 数据 进行 积分 操作 以 提高 数据 的 精确 度 ， 同 时 可 以 节约 存储 空间 。 速 
度 上 ， 需 要 达到 每 3 ms 处 理 一 帧 数据 生成 UVFITS" 文件 ， 才 能 满足 实时 生成 观测 图 像 的 要 求 。 

目前 国外 类 似 的 项 目 有 日 本 野 边 山 宇 宙 观 测 所 (The Nobeyama Radio Observatory, NRO) 5 AE 
南 锡 射 电 望远镜 (The Nancay Decimetric Radio Telescope, NRT) 等 ，MUSER-I 的 数据 规模 远 高 于 国外 现 
有 项 目 。MUSER-I 共有 40 面 天 线 ， 时 间 分 辩 率 为 3 ms， 信 道 为 16 个 。 在 日 本 野 边 山 宇 宙 观 测 所 ， 天 
线 数量 为 84 面 ， 但 时 间 分 辩 率 低 。 相 比 之 下 MUSER-I 的 数据 量 大 约 是 日 本 野 边 山 宇宙 观测 所 的 20 
倍 ， 是 南 锡 射电 望远镜 的 37 倍 。 同 时 在 图 像 处 理 方面 也 有 不 同 的 需求 ， 这 导致 国外 的 日 像 仪 处 理 软 
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件 无 法 直接 引入 。 所 以 ,为 了 更 好 地 支撑 射电 日 像 仪 的 后 续 处 理工 作 ， 设 计 并 实现 一 套 能 够 为 射电 日 
像 仪 服务 的 高 性 能 UVFITS 合成 系统 是 当前 比较 迫切 的 工作 。 

本 文 研 究 了 UVFITS 的 合成 机 制 ， 对 串 行 UVFITS 合成 系统 中 能 够 并 行 化 的 环节 进行 并 行 化 处 理 ， 
在 当前 广泛 使 用 的 成 熟 的 消息 传递 接口 (Message Passing Interface, MPI) 基础 上 上， 结合 具 体 应 用 设计 并 
实现 了 一 套 基 于 消息 传递 接口 的 并 行 数据 合成 系统 ， 用 于 满足 射电 日 像 仪 的 需求 。 


1 UVFITS 合成 流程 


日 像 仪 产生 的 原始 数据 文件 包括 以 下 信息 : 每 一 帧 的 时 间 、 信 和 号 中 心 频率 选择 开关 、 信 和 号 中 心 频 
率 、 信 和 号 带宽 、 量 化 电 平 值 与 浆 值 、 延 迟 调整 开关 、 条 纹 旋转 开关 以 及 子 带 工作 方式 ， 同 时 还 记录 许 
多 时 延 信息 、 天 线 参 数 等 。 为 了 满足 对 数据 存储 的 需要 , 在 UVFITS 文件 中 需要 4 个 二 元 表 : PRIMARY, 
ANTENNA, FREQUENCY, 、SOURCE。 针 对 产生 的 数据 文件 ， 为 了 提高 数据 的 精确 度 ， 需 要 对 数据 进 
行 积分 操作 ， 系 统 会 按照 指定 的 起 始 时 间 和 截止 时 间 要 求 对 数据 进行 积分 操作 。 

为 了 查阅 、 检 索 数 据 的 方便 ， 把 处 理 后 的 数据 保存 为 UVFITS 格式 的 文件 。 整 个 过 程 及 UVFITS 
文件 的 合成 处 理 流程 如 图 1。 

天 线 接收 的 射电 噪声 信号 经 过 低 噪声 放大 融 
放大 后 ， 再 进行 电 / 光 转换 ， 将 电信 和 号 转换 为 光 
言 号 并 通过 光纤 传 至 机 房 '9 。 经 过 模拟 接收 机 
和 数字 接收 机 处 理 后 ， 最 终生 成 约定 格式 的 数据 
并 以 文件 的 方式 存储 。 

下 一 步 ，UVFITS 合成 系统 将 存储 的 原始 数 
据 读 入 内 存 ， 然 后 读 取 其 中 的 时 间 、 日 期 等 数 
据 ， 计 算 当 前 天 线 所 在 位 置 。 把 这 些 处 理 结果 存 


A UVFITS 文件 的 AIPS AN 表 。 合 成 系统 计算 观 S^ 计算 天 线 2| 条 纹 旋转 
AIPS FQ 位 置 DE 
测 时 太阳 的 位 置 ， 存 人 AIPS SU 表 中 。 合 成 系统 I | I 
读 取 天 线 的 极 化 、 接 收 频率 等 信息 存 人 AIPS FR ( TEN iow] SX Eum 
表 。 最 后 ， 处 理 原始 数据 中 的 可 视 数据 ( 图 像 )， AIPS SU Prity - 
T£ X PRIMARY X, 一 

可 视图 像 数据 来 源 于 原始 数据 中 的 可 视 数 


据 。 综 合 孔 径 成 像 原理 要 求 天 线 接 收 的 两 路 信和 号 
同时 同 相 到 达 相 关 器 "1 ， 在 实现 过 程 中 ， 需 要 对 Wu E 

系统 延 时 和 相位 进行 补偿 ， 这 就 是 延 时 补偿 和 条 Fig.l The UVFITS assembly flow 

BUE IETOR! 。 在 生成 UVFITS 文件 中 PRIMARY 

表 时 ， 根 据 输入 的 时 间 以 及 其 他 参数 ， 系 统 需要 对 可 视 数据 进行 处 理 ， 如 果 是 多 帧 合成 ， 需 要 积分 ， 
如 不 合成 ， 转 存 即 可 。 在 这 步 操作 中 ， 对 每 一 帧 的 时 间 、 位 置 以 及 可 视 数 据 等 信息 进行 处 理 。 最 后 ， 
将 4 个 表 ( AIPS AN, AIPS SU, AIPS FR、PRIMARY ) 中 的 数据 ， 添 加 上 若干 UVFITS 文件 的 关键 字 存 
AXIE, 


2 UVFITS 合成 处 理 并 行 化 分 析 


由 于 单机 性 能 有 限 ， 为 了 尽 可 能 大 地 提升 程序 性 能 ， 并 具有 进一步 提升 的 空间 ， 选 择 多 机 并 行 的 
方式 ， 并 且 使 用 其 中 具有 代表 性 的 消息 传递 接口 作为 多 机 并 行 的 方案 。 

通过 分 析 ， 程 序 的 整个 运行 过 程 ， 大 致 可 以 归纳 为 输入 运行 参数 、 读 取 数 据 、 处 理 数据 、 输 出 数 
据 。 其 中 处 理 数据 又 可 以 分 为 分 析 数 据 和 整理 、 积 分 数据 。 
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在 程序 中 可 以 做 到 并 行 的 部 分 有 读 取 数据 、 处 理 数 据 和 输出 数据 。 在 测试 中 发 现 ， 程 序 的 时 间 开 
销 主要 集中 在 读 取 数据 以 及 整理 、 积 分 数据 两 个 过 程 。 其 中 程序 读 取 数据 这 部 分 占用 了 整个 程序 运行 
时 间 的 83% 左 右 ， 处 理 数据 中 的 整理 、 积 分 数据 大 约 占 了 整个 程序 运行 时 间 的 12% 。 

在 初步 验证 性 并 行 测试 中 发 现 ， 对 数据 的 整理 、 积 分 进行 并 行 处 理 的 效果 并 不 理想 。 在 多 机 并 行 
条 件 下 ， 数 据 的 通信 时 间接 近 数 据 处 理 的 时 间 ， 导 致 增加 节点 对 性 能 的 提升 几 近 于 无 。 而 单机 并 行 的 
情况 下 ， 由 于 总 线 速度 的 瓶颈 ， 单 核 与 多 核 的 运行 时 间 相 差 无 几 。 

据 此 ， 在 程序 的 读 取 数 据 ， 即 读 取 原 始 数据 中 的 帧 部 分 ， 采 用 并 行 处 理 。 
2.1 数据 的 并 行 化 处 理 
2.1.1 方案 设计 与 数据 划分 

本 系统 使 用 的 方案 ， 在 集群 环境 中 采用 主 从 模式 实现 可 视 数 据 的 并 行 处 理 。 主 要 执行 顺序 为 ， 主 
节点 将 等 待 读 取 的 原始 数据 以 帧 为 处 理 单元 ， 划 分 为 若干 任务 ， 按 顺序 将 任务 分 发 给 每 个 子 节点 ; 每 
个 子 节点 处 理 完 接收 的 任务 后 将 处 理 完毕 的 文件 写 给 主 节 点 。 

在 方案 设计 中 ， 对 帧 的 划分 以 一 帧 为 一 个 单 | 


位 ， 按 照 节点 数 的 不 同 ， 平 均 分 配 到 每 个 节点 上 
由 各 节点 读 取 。 在 每 个 参与 计算 的 子 节点 上 ,各 ex] 
存 有 一 份 完整 的 帧 头 信息 。 在 各 子 节点 内 ， 再 将 。 


数据 按 初始 设 定 的 进程 数 进一步 划分 ， 并 在 进程 | 根据 需要 产生 进程 并 分 配 各 进程 任务 | E 
= 内 处 理 完毕 。 各 子 节点 产生 的 结果 文件 直接 写 入 | ü » | 
LS 0 主 节 点 的 存储 介质 ， 各 子 节点 间 无 需 通信 。 并行 | a 
- 部 分 的 流程 示意 图 如 图 2. ! | 。 创建 并 调度 进程 执行 各 并 行 环节 处 理 任务 “| E 
= 2.1.2. 结果 合并 | E 
| 各 节点 接收 的 任务 均 为 至 少 一 个 完整 的 帧 ， | | | | | | | | | ži 

同时 每 帧 存 有 各 自 的 时 间 信 息 。 完 成 任务 后 , 计 1 

算 结果 由 子 节点 直接 写 人 主 节点 的 存储 介质 中 保 i 

存 为 文件 ， 文 件 名 为 各 节点 数据 中 读 取 的 时 间 。 : 

由 于 任务 间 相互 独立 ， 合 并 结果 的 开销 仅 与 主 节 om ums] c7 Uv 


点 存储 介质 的 输入 /输出 性 能 有 关 。 
图 2 并 行 部 分 程序 执行 流程 图 
Fig.2 The parallel execution flow of the 
3 性 能 分 i 
t HEJJ Wr UVFITS assembly system 


并 行 UVFITS 文件 的 合成 过 程 相对 于 顺序 的 UVFITS 文件 合成 步骤 ， 加 入 了 数据 在 节点 间 的 分 发 
与 收集 。 这 样 与 串 行 的 过 程 相 比 ， 额 外 增加 了 节点 间 通 信 的 开销 。 

本 节 的 性 能 分 析 以 原始 数据 读 和 人 内存 后 的 时 间 为 基准 ， 性 能 分 析 的 标准 为 加 速 比 以 及 并 行 环境 下 
程序 所 耗费 的 时 间 。 下 面 为 两 种 方式 的 通用 表示 。 
3.1 相对 加 速 比 

同一 并 行 算法 ， 在 单 节 点 上 的 运行 时 间 与 在 多 节点 构成 的 处 理 机 系统 上 的 运行 时 间 相 比 ， 定 义 为 
相对 加 速 比 (以 下 简称 加 速 比 ) ， 用 来 衡量 并 行 系统 或 程序 并 行 化 的 性 能 和 效果 。 计 算 方法 如 (1) 式 : 


Sp T T eriat” T parallel , ( 1 ) 


其 中 ，7.。a 是 程序 在 串 行 方式 下 运行 耗费 的 时 间 ， 串 行 方式 采用 了 与 并 行 相同 的 算法 ; 7, 是 程序 
在 并 行 环境 下 运行 耗费 的 时 间 。 
3.2 ”并行 方 式 下 程序 运行 的 时 间 开 销 

这 里 的 时 间 取 程序 读 入 内 存 后 一 直到 执行 完毕 耗费 的 时 间 。 由 于 采用 了 并 行 方式 ， 程 序 额 外 产生 
了 节点 间 通 信 的 时 间 开 销 。 同 时 ， 程 序 的 总 时 间 由 耗费 时 间 最 长 的 节点 决定 。 时 间 的 计算 如 (2) 式 : 
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其 中 ，7,, 为 根 节 点 广播 数据 耗费 的 时 间 ， 广 播 的 数据 为 每 个 节点 均 需 要 的 数据 ， 即 目前 程序 运行 的 
参数 。 通 过 此 参数 ， 各 节点 能 计算 本 节点 所 需 执行 的 任务 在 裸 数据 中 的 起 止 位 置 ; 7 为 根 节点 点 对 
点 通信 耗费 的 时 间 ; Tsuse 为 根 节点 计算 、 处 理 数 据 耗费 的 时 间 ;也 .为 根 节点 接收 时 间 耗 费 最 长 的 
节点 的 数据 耗费 的 时 间 。 


4 实验 分 析 


测试 的 硬件 环境 为 4 台 曙 光 天 阔 A620r-G， 中 央 处 理 器 为 AMD Opteron 6128 ， 主 频 2.0 GHz, VJ 
TF 4GB; 硬盘 为 希捷 ST3250310AS，7 200 转 ， 缓 存 8 MB ， 容 量 为 250 GB; 操作 系统 为 Linux， 机 群 
数据 交换 的 速度 为 1 Cbps， 采 用 的 消息 传递 接口 实现 为 MPICH-2。 在 对 系统 的 测试 中 ， 从 文件 名 为 
MUSER_20140122-131903_342668765 的 原始 数据 中 随机 取 4 段 观 测 数据 ， 数 据 量 分 别 为 415 tvi, 735 
帧 、1 055 帧 、1 375 帧 。4. 1、4.2、4.3 为 在 对 数据 不 积分 和 进行 5 帧 积分 情况 下 进行 测试 得 到 的 结果 。 
4.1 单机 串 行 
一 表 1 为 单机 串 行 环境 下 ， 程 序 在 处 理 不 同 的 
a 数据 量 时 耗费 的 时 间 。 从 表 1 可 以 发 现 ， 时 间 随 


表 1 单机 串 行 执行 时 间 


Table 1 Stand-alone serial execution time 


着 帧 数 的 增加 而 线性 增加 ， 但 时 间 效率 远 低 于 身 TER I S SUNUMGE OINSIUM 

电 日 像 仪 对 UVFITS 的 数据 存储 需求 的 每 帧 3 ms P /s fs i 7s 
= 处 理 时 间 ， 仅 达到 了 目标 效率 的 一 半 。 415 | 406 0.00978 2.59 0.00624 
- 4.2 单机 并 行 735 7.17 0.00075 4.59 0.00624 


M. 表 2 是 在 单 合 服务 器 上 ， 分 别 使 用 一 进程 、 1 055 10.28 — 0.009 75 6. 60 0. 006 25 
—- 四 进程 以 及 八 进 程 运行 程序 得 到 的 时 间 耗 费 以 及 
c 加 速 比 。 可 以 看 到 ， 节 点 数 每 增加 一 倍 ， 执 行 时 1 375 13.41 0.009 75 8.59 . 0.00624 
N 间 缩短 一 半 以 上 ， 程 序 并 行 的 加 速 比 稳定 在 1 以 
> 上 ， 即 每 有 w 个 进程 ， 程 序 的 执行 时 间 小 于 等 于 原 时 间 的 1/V。 同 时 ， 随 着 数据 量 的 增加 ， 即 帧 数 的 
增加 ， 程 序 耗费 的 时 间 呈 线性 上 升 。 这 说 明 程 序 的 效率 是 可 以 预计 的 ， 在 需要 程序 达到 更 高 的 速度 
时 ， 可 以 对 需要 增加 的 进程 有 一 个 初步 估计 。 
4.3 多 机 并 行 

K 3 是 程序 在 4 台 服 务 器 组 成 的 四 节点 集群 并 行 环境 下 ， 分 别 使 用 二 进程 、 四 进程 、 八 进程 运行 
程序 得 出 的 时 间 和 加 速 比 。 与 单机 环境 下 的 并 行 相 比 ， 执 行 时 间 略 有 增加 。 这 是 由 于 进程 在 不 同 机 器 
节点 间 通 信 的 时 间 远 大 于 进程 通过 系统 内 部 总 线 传递 数据 的 通信 时 间 ， 导 致 额外 的 时 间 开 销 。 加 速 比 
约 等 于 1， 这 意味 着 每 增加 一 倍 节 点 ， 时 间 的 开销 仍然 缩短 接近 一 半 。 同 时 ， 总 体 效 果 达 到 了 期 望 
值 ， 超 出 了 3 ms 处 理 一 帧 数据 的 需求 。 
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本 文 针 对 射电 日 像 仪 对 高 性 能 UVFITS 数据 合成 要 求 ， 研 究 了 基于 消息 传递 接口 的 高 性 能 UVFITS 
合成 系统 。 系 统 可 以 根据 实际 需要 将 观测 得 到 的 原始 数据 高 速 转换 成 可 以 导入 天 文 应 用 软件 公共 包 的 
标准 UVFITS 文件 。 目 前 ， 优 化 后 的 并 行 UVFITS 合成 系统 在 八 进 程 的 运行 环境 下 ， 只 需要 1.2 ms 即 
可 处 理 一 帧 文件 ， 已 经 满足 当前 射电 日 像 仪 对 3 ms 每 帧 的 速率 需求 ， 性 能 比 需求 提高 了 1.5 倍 。 另 
外 ， 基 于 消息 传递 接口 的 并 行 合 成 系统 ， 从 实验 中 可 以 看 到 具有 很 好 的 扩展 性 ， 这 为 下 一 步 射 电 日 像 
仪 更 高 性 能 的 数据 合成 提供 了 可 能 性 ， 同 时 ， 也 能 够 满足 未 来 射电 日 像 仪 产生 的 更 多 数据 的 实时 合成 
处 理 需 要 。 
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R2 单机 并 行 执行 时 间 表 3 多 机 并 行 执行 时 间 

Table 2 Stand-alone parallel execution time Table 3 Multi-machine parallel execution time 
指标 | 总 时 间 “平均 每 帧 “加速 指标 | 总 时 间 “平均 每 帧 ”加速 

帧 数 /s /s 比 帧 数 /s /s 比 
415 1.95 0.00469 2.082 415 2. 05 0.00494 1.980 
KEY 735 3. 45 0.00469 2.078 KEY 735 3. 61 0.00491 1.986 
1055 4. 98 0.004 72 2.066 1055 5.17 0.00490 1.990 
一 进程 1375 6.44 0.00468 2.082 一 进程 1375 6.71 0.004 88 1.998 
415 1. 27 0.00306 2.039 415 1.30 0.00313 1.992 
BU 735 2.25 0.00306 2.040 BUY 735 2.30 0.00312 1.995 
1 055 3. 23 0.00306 2.043 1055 3.30 0.00312 2.000 
1375 4.20 | 0.00305 2.045 1375 4.30 | 0.00312 1.997 
415 0. 97 0.00233  Á 4.185 415 1. 02 0.00245 3.980 
KEV 735 1. 69 0.00229 4.242 KEY 735 1.81 0. 002 46 3.961 
1 055 2.44 0.00231 4.217 1 055 2.58 0.00244 3.988 
Vue 1375 3.16 0.00298 4.243 四 进程 1375 3.37 0.00245 3.979 
415 0. 61 0.00147 4.245 415 0.64 | 0.00154 4.046 
积 / 735 1. 09 0.00148 4.211 积 / 735 1.14 0.00155 4.026 
1 055 1.58 0.00149 4.177 1 055 1.64 0.00155 44.024 
1375 2. 05 0.00149 4.190 1375 2.14 0.00155 4.014 
415 0. 49 0.00118 8.285 415 0. 49 0.00118 8.285 
KEV 735 0. 84 0.00114 8.535 KEY 735 0. 86 0.00117 8.337 
1 055 1.20 0.00113 8.575 1055 1.24 0.00117 8.298 
AER 1375 1.61 0.00117 8.329 Aul 1375 1. 66 0.00120 8.078 
415 0. 32 0.000 77 8.093 415 0. 33 0.00079 7.848 
积 / 735 0. 55 0.00074 8.345 积 / 735 0. 56 0.00076 8.196 
1055 0. 78 0.000 73 8.461 1055 0. 83 0.00078 7.951 
1375 1.04 0.00075  Á 8.259 1375 1. 07 0.00077 8.028 


在 未 来 的 工作 中 进一步 研究 如 下 问题 : (1) 继 续 优 化 数据 处 理 流 程 ， 提 高 并 行 度 ， 从 而 提升 合成 
UVFITS 文件 的 速度 ; (2) 在 并 行 环 境 中 ， 提 前 对 多 机 进行 文件 同步 以 达到 流水 线 效果 ， 从 而 减少 子 
节点 对 主 节点 存储 介质 访问 的 通信 时 间 ; (3) 为 数据 处 理 以 及 归档 查询 系统 提供 应 用 程序 编程 接口 
( Application Programming Interface, ，API) ， 满 足 数据 访问 的 需要 。 
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Abstract: Mingantu Ultrawide Spectral Radioheliograph ( MUSER ) generates 100 kilobytes raw 


observational data in every 3 milliseconds and more than 3. 5 Terabytes data per day. For further data analysis 


and sharing, it is necessary to convert the raw data stored in self-defined format to standard format usually used 


in the field of radio astronomy. In previous work, we have analyzed the format of UVFITS and converted the 


raw data to UVFITS file successfully. However, the efficiency of the format converting system needs to be 


further improved. This paper presents a parallel UVFITS file assembly system based on cluster parallel 


environment. Experiments show that the system can reduce the execution time of assembling a UVFITS file to 


about 1. 2 milliseconds, 2. 5 times faster than that of the data acquisition, which is very promising to meet the 


data processing requirements in the project. Moreover, the parallel system can be used for reference in other 


systems. The implementation of this parallel data format converting system can also provide a good reference to 


similar data processing systems. 
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